Esercizio serie storica

Questo secondo esercizio richiede di effettuare un'analisi di dati di serie storica.

Leggendo il dataset data/globaltemperatures.csv, caricare i dati della media della temperatura nei diversi mesi dell'anno dal 1750. Plottare la serie dati, analizarne le caratteristiche (tendenza e stagionalità) e provare a fare una regressione lineare del trend (per valutarne la tendenza). Per fare regressione lineare di una timeseries è conveniente trasformare l'indice (l'asse X) in un numero che indica il numero di periodi passati dal momento inziale.

Infine provare a usare la serie storica per produrre le temperature dei successivi 10 anni.

Indice

Setting

Lettura dataset

Pre processing ed Esplorazione

Caratteristiche principali

Verifica duplicati

Verifica missing values

Gestione missing values

Feature engineering

Serie storica a diverse granularità

Analisi distribuzione variabile di interesse

Analisi autocorrelazione

Decomposizione

Analisi tendenza

Analisi stagionalità

Trend e Ciclo

Rolling Mean e Standard Deviation

Regressione lineare del trend

Preparazione dati

Divisione in train e test set

Fit del modello sul train test

Previsioni sul test set

Performances sul test set

Per misurare la bontà di adattamento del modello ai dati si possono considerare diverse metriche:

Fit del modello su tutti i dati

Previsioni

Visualizzazione risultati

Previsioni con ARIMA

Si procede con la previsione dei valori di temperatura per i prossimi 10 anni.

Preparazione dati

Verifica stazionarietà

Divisione in train e test

Implementazione modello

Analisi dei residui modello selezionato

Previsioni sul test set

Valutazione performances sul test set

Previsioni dal 2016 al 2026

Previsioni con Prophet

Prophet è una tecnica per eseguire il task di predizione di serie storiche basato su modello di tipo addittivo dove i trend non lineari sono fittati con stagionalità di diversi tipi, considerando anche gli effetti delle vacanze. Il modello Prophet lavora molto bene con dati che presentano forti effetti stagionali sui dati storici. Prophet inoltre è robusto ai missing values e gestisce molto bene gli outliers (https://facebook.github.io/prophet/).

Tuttavia recentemente ci sono stati alcuni articoli scientifici che hanno messo in dubbio le reali performance di Prophet (https://analyticsindiamag.com/facebook-prophets-existential-crisis/).

Si procede con la previsione dei valori di temperatura per i prossimi 10 anni.

Preparazione dati

Divisione in train e test

Implementazione modello

Previsioni sul test set

Valutazione performances sul test set

Previsioni dal 2016 al 2026